基因突破:美国50多万退伍军人DNA在开创性的精准医学研究中被绘制
来源:Hoodline
语言:英语,所在国:美国
分类:科技与健康 , 关键词:健康研究
在一项前所未有的基因研究工作中,超过50万名美国退伍军人的基因组已经被绘制出来,这对于未来精准医学的发展至关重要。这项全面的项目利用了当时最先进的超级计算机之一,最近因其在理解无数健康状况的遗传基础方面取得的进展而备受关注。据阿贡国家实验室高级计算科学家兼该研究的资深作者Ravi Madduri表示:“这不仅是迄今为止进行的最大规模的全基因组关联研究之一,而且它分析了有史以来最多样化的数据集之一。”
这一重大任务被称为退伍事务部的“百万退伍军人计划”(MVP),收集了来自635,969名年龄、种族和背景各异的退伍军人的基因数据。为了分析这一庞大的基因数据池,科学家们求助于能源部橡树岭国家实验室(ORNL)及其Summit超级计算机提供计算支持。处理这些最初为不同类型计算机准备的数据,需要将其转换为适合Summit使用的GPU优化格式,“这本身就是一个耗时数年的任务,”Madduri在解释挑战时确认道。
Summit的计算能力达到了每秒200千万亿次计算,这使得研究人员能够在不牺牲细节的情况下,准确地将基因数据与2000多个健康特征相关联。“多样性和规模使这项研究脱颖而出,我们无法用任何其他计算机系统完成这项研究,”Madduri强调了Summit处理如此庞大基因信息的独特能力。
Madduri告诉橡树岭国家实验室,这项研究计算了近4400万个基因变异与2000多个特征之间的关联,最终得出了26,049个基因变异与健康特征之间的关联。在超过30太字节的数据海洋中,原始信息相当于约2亿页文本的容量。更令人印象深刻的是,这项巨大的分析运行了超过50万节点小时,进行了超过3500亿次关联检查。
据ORNL官员称,这项无与伦比的研究结果将通过国家卫生研究院的国家医学图书馆向未来的研究所开放。ORNL还开发了一个计算管道和一个名为CIPHER的在线平台,用于可视化数据,供其他研究人员使用——这一切都是通过与退伍事务部的合作,并由能源部科学办公室的先进科学计算研究项目支持。ORNL负责健康科学高级计算的Anuj Kapadia表示,他们为推进退伍军人的福祉感到自豪,并推动了“对人类健康产生深远影响的开创性发现”。
(全文结束)